#opción americana

Parada Óptima Continua mediante Aprendizaje por Refuerzo Profundo

CARLOS: un nuevo algoritmo de RL en tiempo continuo que supera a los solvers Bermudas, acercándose al límite superior americano con alta eficiencia.